روشی نوین برای بهبود عملکرد یادگیری Q با افزایش تعداد بهروز رسانی مقادیر Q برپایه عمل متضاد

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "روشی نوین برای بهبود عملکرد یادگیری Q با افزایش تعداد بهروز رسانی مقادیر Q برپایه عمل متضاد"

Transcript

1 روشی نوین برای بهبود عملکرد یادگیری Q با افزایش تعداد بهروز رسانی مقادیر Q برپایه عمل متضاد مریم پویان امین موسوی شهرام گلزاری احمد حاتم دانشجوی کارشناسی ارشد گروه برق و کامپیوتر دانشگاه هرمزگان بندرعباس pouyan.student@hormozgan.ac.ir گروه برق و کامپیوتر 2 mousavi@hormozgan.ac.ir 3 golzari@hormozgan.ac.ir 4 hatam@hormozgan.ac.ir استادیار دانشگاه هرمزگان بندرعباس چکیده الگوریتم یادگیری Q یکی از بهترین الگوریتمهای یادگیری مستقل از مدل میباشد. هدف از یادگیری یافتن تخمینی از تابع ارزش - عمل بهینه میباشد که مقادیر Q نامیده میشود. یکی از عمده ترین مشکالت روش یادگیری Q در برخورد با مسائل دنیای واقعیی زیاد شدن تعداد حالتهای محیط و در نتیجه کم شدن سرعت همگرایی است زیرا برای تضمین همگرایی یادگیری تمامی زوجهای حالت - عمل باید بینهایت بار بازدید شود. در این نوشتار از روش ترکیبی بر پایه مفاهیم عمل متضاد استفاده شیده اسیت. مفیاهیم تضاد در یادگیری تقویتی منجر به بهبود سرعت همگرایی میشود زیرا در آن بهروز رسانی مقادیر Q برای عمل و عمل متضاد متناظر آن در یک مرحله و بصورت همزمان انجام میپذیرد. یادگیری Q برای افزایش سرعت روش ارائه شده همراه با یافتن بهترین اثر متقابل بیین اکتسیاو و اکتشیاف در همگرایی یادگیری استفاده شده است. تکنیک ارائه شده برای مسئله Grid world شیبیه سیازی شده است. نتایج به دست آمده بهبود در فرایند یادگیری را نشان میدهد. کلمات کلیدی یادگیری تقویتی یادگیری Q عمل متضاد اکتساو اکتشاف 226

2 - مقدمه امروزه بسیاری از مسائل دنیای واقعی به وسیلهی تکنیکهای اتخاذ شدده در ماشینهای هوشمند بررسی و حل میشوند. یادگیری تقویتی شاخهای از دانش هوش مصنوعی است که به بررسی حوزهی یدادگیری از رریدت تعامدل و بده شیوه آزمون و خطا میپردازد. بنابراین اگر عملی منجر به بهبود وضعیت شدود تمایل به انجام آن تقویت میشود و امکان انجام آن در صدور عددم بهبدود تضعیف میشود. برای حل مسائل یادگیری تقویتی سه راه حل کلدی برنامده نویسدی پویدا روش مونت کارلو و روش تفاضل زمانی مطرح است []. روش تفاضل زمانی از اصلیترین روشهایی است کده در یدادگیری تقدویتی مدورد اسدتفاده قدرار میگیرد و ترکیبی از روشهای برنامه نویسی پویا و مونت کارلو میباشد. یادگیری Q الگوریتم کنترلی تفاضل زمانی off-policy است که بهرور همزمان در محیط کاوش انجام میدهد و سیاست بهینه را یاد میگیرد. این الگوریتم به دلیل آسان بودن پیاده سازی و تئوری خوب توسعه یافته به صور گستردهای مورد استفاده قرار گرفته است. در روش یادگیری Q افزایش تعداد حالتهای محیط به عنوان چالشی مطرح میباشد []. زیرا افزایش تعداد حالتها باعث کاهش سرعت همگرایی و درنتیجه افزایش هزینه در یادگیری عامل میشود. بنابراین ارائه روشهایی که باعث افزایش سرعت یادگیری عامل میشوند ضروری مینماید. تاکنون روشهای گوناگونی برای بهبود یادگیری Q ارائه شده است. عمدهی این روشها به پنج دسته اصلی تقسیم میشوند که هر کدام تالش بر بهبود یادگیری باتوجه به محدودیتهای موجود در یادگیری Q دارند. ساختار کلی این پژوهشها در پنج دسته زیر شرح داده شده است. استراتژی بهروز رسانی مقادیر Q: در پژوهش[ 2] الگدوریتم Q(λ) بده عنوان یک الگوریتم چندگامه افزایشی پیشنهاد شده اسدت. در پدژوهش [3] برای دستیابی به مسیر بهینه در محیط ناشناخته تعداد بهروز رسانی مقادیر Q پس از انجام یک عمل افزایش داده شده است. در این روش زمانی که یک عمل توسط عامل انجام میگیرد زنجیرهای از حالتها که در رول فرایند جستجو تشکیل شده و شامل وضدعیت جداری تدا نقطده شروع میباشد برای بهروز رسانی درنظر گرفته میشود. در پژوهشهای نظیر [5,4] یادگیری Q مبتنی بدر تضداد معرفدی شدده اسدت. محدور اصلی این پژوهشها افزایش تعداد بهروز رسدانی تدابا ارزش مدیباشدد بدین گونه که اگر عامل ارزش عمل مخالف را نیز بداند به جدای یدک مقدار میتواند دو مقدار از تابا ارزش را بهردور همزمدان بدهروز رسدانی کند. کداهش زمدان اکتشدا و افدزایش سدرعت همگرایدی بده عندوان دستاوردهای این روش بیان شده است. استراتژی کاهش فضای حالت: یکی از محدودیتهای اسدتفاده از روش یادگیری تقویتی همان رور که قدبال ذکدر شدد در کداربردهدای واقعدی رویارویی با فضای حالت بسیار بزرگ میباشد که باعث مدیشدود زمدان یادگیری روالنی شود و حافظه مورد انتظار برای ذخیره جددول Q زیداد شود. اکثر تحقیقا نظیر [6-8] در زمینه کداهش حداال یدا تجزیده وظایف به زیر وظایف کوچکتر و یا تعمیم تجربدههدای عامدل یدادگیری انجام شده است. استراتژی استفاده از دانش پیشین و مقداردهی اولیه Q: اگرچه استفاده از دانش اولیه باعث افزایش سرعت یادگیری تقویتی گدزارش شدده اسدت [9]. اما اگر این دانش حاوی ارالعا اشتباه باشدد دارای اردرا سدو مانند جلوگیری از رسیدن به سیاست بهینه میشود که منجر به کم شدن سرعت یادگیری میشود []. در [] روشی را با استفاده از کنتدرل بر روی دانش پیشین ارائه کردهاند که تاریر بد را سرکوب کندد. در ایدن روش با درنظر گرفتن فاکتور فراموشی برای عامل باعث بهبود یادگیری شدند. در[ ] یادگیری Q مبتنی بر شبکه عصبی را پیشدنهاد دادهاندد. که در آن برای مقداردهی اولیده مقدادیر Q از شدبکه عصدبی اسدتفاده کردهاند. نتایج بیان شده نشدان دهنددهی بهبدود عملکدرد الگدوریتم بدا استفاده از مقداردهی اولیه اکتشافی میباشد. استراتژی شکلدهی تابا پاداش: برای تسریا فرایند یادگیری روشهایی همچون یادگیری Q بیزی یدادگیری Q کنددرو و یدادگیری Q نسدبی برای دستیابی به پاداش بیشتر مورد بررسی قرار گرفته است[ 2 3]. در [4] برای رراحی تدابا تقویدت از تدابا پداداش پیوسدته و تخمدینزن پیشرفت برای سرعت بخشیدن به یادگیری بهره گرفته شده است. استراتژی انتخاب عمل: در[ 5 ] پیدا کردن سیاست بهینه در یادگیریQ به جستجوی یک راهحل در مسائل بهینه سدازی ترکیبدی تبددیل شدده است. در این روش از معیار Metropolis الگوریتم شبیه سازی تبرید به منظور مصالحه بین اکتشا و بهره برداری استفاده شده است. در [] اکتشا برپایه تفاضل ارزش برای تعادل بین اکتشا و بهره برداری در یادگیری تقویتی درنظر گرفتده شدده اسدت. در[ ] اکتشدا بدر پایده تفاضل ارزش که با انتخاب عمل سافتمکس ترکید شدده بده عندوان سیاست تطبیقی در یادگیری تفاضل زمانی پیشنهاد شده است. در این پژوهش از ترکی استراتژیهای بدهروز رسدانی مقدادیر Q و انتخداب عمل استفاده شده است. با الهام از الگوریتم یدادگیری Q مبتندی بدر تضداد و تغییر قسمت بهروز رسانی مقادیر Q یک الگوریتم جدید پیشنهاد میشود. کده در آن به منظور رسیدن به رویه بهینه از اکتشا بر پایه تفاضل ارزش ترکی شده با رویه سافتمکس استفاده شده است. مشکل موجود مقدادیر Q گمدراه کننده که در پژوهش پیشین [5] وجود داشته است و باعث سدردرگمی عامدل بوده است در این کار بررر شده است. سازماندهی ساختار مقاله به اینصور است که در بخش 2 ابتدا یادگیریQ به صور مختصر شرح داده شده است. سپس مروری بر پژوهش پیشدین در زمینه یادگیریQ مبتنی بر تضاد شده است. در بخش 3 روش کار توضیح داده شده استکه درآن الگوریتم پیشنهادی بیان میشود. ارزیابی و نتایج آزمایشها در بخش 4 آورده شده است. در نهایت نتیجهگیری در بخش 5 آورده شده است. 2- یادگیری Q و یادگیری Q مبتنی بر تضاد --2 یادگیری Q یادگیری Q اولین بار توسط واتکینز معرفی شد[ 8 ]. یادگیری Q تک گامی به این صور تعریف میشود که عامل در هر تکرار یکی از مقادیر Q را برای هر جفت حالت عمل مطابت رابطه )( بهروز رسانی میکند: Q( s, a) Q( s, a) [ r max a ' Q( s ', a ') Q( s, a)] ) ( 227

3 نمادهایی که برای محاسبه یک گام یادگیری Q در فرمول) ( اسدتفاده شدده است به صور زیر تعریف میشوند که این نمادها در [] استفاده شدهاند. s= حالت فعلی =a عمل ˈs= حالت بعدی ˈa= عمل حالت بعدی r= پاداش فوری α= پارامتر نرخ یادگیری γ= فاکتور تخفیف یا ضری تنزیل a و عمل s ارزش حالت - عمل برای حالت = Q(s, (a فاکتور گاما میزان آیندهنگری عامل را بیان میکند که نشان دهندهی ارربخشی ارزش پاداشهای آینده در روند تصمیمگیری فعلی است. افزایش مقدار این پارامتر باعث میشود که در روند تصمیمگیری به پاداشهای آینده اهمیت بیشتری داده شود و ارزش حالت بعدی تاریر بیشتری نسبت به ارزش حالت فعلی داشته باشد. بنابراین زمانیکه انتخاب عمل بهدرستی صور نگیرد موج کاهش سرعت همگرایی میشود. اگر مقدار این پارامتر کوچک در نظر گرفته شود تاریر پاداشهای آینده کمتر شده و همگرایی را تحت تاریر قرار میدهد چون از گسترش پاداش حالت هد جلوگیری میشود. فاکتور آلفا برای تاریر خطای اختال زمانی در هنگام بهروز رسانی ارزش فعلی حالت- عمل استفاده میشود که سرعت تغییر مقدار Q در بهروز رسانی را مشخص میکند. افزایش فاکتور آلفا باعث میشود که بخش بیشتری از مقدار بهروز رسانی بهوسیلهی ارزش حالت فعلی تقویت شود. انتخاب مقادیر کوچکتر برای آلفا مزایایی چون کنترل تاریر منفی یک بهروز رسانی نادرست را دارا است. برای پیاده سازی این روش یک جدول Q درنظر گرفته میشود که هر خانه جدول به یک جفت حالت- عمل تعلت دارد. یادگیری در این الگوریتم بدین صور است که در هر دوره عامل در یک حالت تصادفی قرار داده میشود و تا رسیدن به حالت پایانی مقادیر جدول برای هر جفت حالت- عمل بر اساس رابطه )2( بهروز میشود. شکل) ( این فرایند را نشان میدهد. r s0 S S2 a0 a a2 r2 r3 Terminal State شکل) (: یک دوره یادگیری همانرور که در شکل) ( نشان داده شده است با این فرض که عامل در حالت s 0 قرار دارد عمل a 0 را ربت سیاست مشتت شده از مقادیر Q انتخاب نموده و پاداش r را از محیط دریافت میکند. حالت بعدی محیط s را مشاهده میکند و تا رسیدن به حالت پایانی این روند را تکرار میکند یادگیریQ مبتنی بر تضاد زمان مورد نیاز برای همگرایی روش Q متناس با سایز جدول Q است. با افزایش سایز جدول Q زمان پر کردن آن نیز افزایش مییابد. الگوریتمهای مبتنی بر تضاد دارای این مزیت میباشند که با افزایش تعداد بهروز رسانی مقادیر Q باعث افزایش سرعت یادگیری میشوند. زیرا عامل با انجام یک عمل عمل متضاد متناظر را نیز درنظر میگیرد و بهصور همزمان میتواند دو مقدار از جدول Q را پر کند. برای یافتن درجه تضاد میتوان از رابطه) 2 ( استفاده نمود. معیاری است که تضاد بین دو عمل a و a 2 را مشخص میکند و درجه تضاد نامیده میشود. η تشابه حالت نامگذاری شده که بر اساس کالستر حالت یا ربت رابطه )3( اندازهگیری میشود[ 5 ]. (s,s ) i j k k Q(s,s ) Q(s,s ) i k j k max Q(s,s ) Q(s,s ) i k j k ) 3( در پژوهش[ 5 ] سه الگوریتم بر مبنای تضاد مشتت شده از یادگیری Q معرفی شده که عبارتند از OQL2 OQL و.OQL3 ایده اصلی این الگوریتمها این است که اگر عامل به ازای یک عمل پاداش دریافت کند برای عمل متضاد متناظر با آن یک جریمه دریافت میکند. اولین نسخه الگوریتم )OQL( بدین صور است که در هر گام عامل با انجام عملa و دریافت پاداش r برای عمل متضاد متناظر مجازا دریافت میکند. بهروز رسانی برای مقادیر حالت عمل و حالت- عمل متضاد مطابت رابطه )4( انجام میگیرد: Q ( s, a) Q(s,a) [r max a ' Q ( s ', a ') Q ( s, a)] )4( Q(s,a) Q(s,a) [r max a '' Q ( s '', a '') Q( s, a)] در دومین نسخه الگوریتم) OQL2 ( نرخ یادگیری برای بهروز رسانی مقادیر ارزش حالت- عمل متضاد به صور تابا کاهشی مطابت فرمول )5( بهروز میشود: i ) 5( n E که در آن i نشان دهندهی تکرار و n E تعداد اپیزود میباشد[ 5 ]. بهروز رسانی برای مقادیر حالت- عمل انجام میگیرد سپس نرخ یادگیری ربت رابطده )5( بهروز میشود و مقدار تابا ارزش برای جفت حالت- عمل متضداد نیدز بدهروز میشود. بنابراین همانند رابطه) 6 ( داریم: Q( s, a) Q(s,a) [r max a' Q( s ', a') Q( s, a)] بهروز رسانی نرخ یادگیری ربت رابطه) 5 ( Q(s,a) Q(s,a) [r max a'' Q ( s '', a '') Q ( s, a )] ) 6( در سومین نسخه الگوریتم) OQL3 ( برای تعداد محدودی از اپیزودها در آغاز یادگیری مثال 4 تعداد کل اپیزودها بهروز رسانی اضافی انجام میگیرد. در پژوهش[ 5 ] با فرض اینکه موقعیت هد شناخته شده است تابا پاداش اینگونه تعریف شده که زمانیکه عامل یک عمل را انجام میدهد اگر فاصله اقلیدسی بین عامل و هد کاهش یابد یا تغییر نکند عامل پاداش + دریافت میکند و زمانیکه فاصله ذکر شده افزایش یابد پاداش - دریافت مینماید. پاداش به رور ضمنی رفتار بهینه را برای عامل توصیف میکند به همین دلیل به کارگیری غلط آن میتواند باعث گمراه نمودن عامل شود. در شکل) 2 ( نمایی از یک محیط نشان داده شده است که نشان دهندهی این امر میباشد. فرض شده که عامل در موقعیت x قرار دارد و عمل a را انجام میدهد و به حالت 'x میرود چون فاصله تا هد کاهش یافته بنابراین پاداش + دریافت میکند و همزمان برای عمل مخالف مجازا - دریافت میکند زیرا فاصله تا هد برای انتساب پاداش و جریمه برای عامل استفاده شده است. ایجاد مقادیر اشتباه Q باعث گمراهی عامل در انتخاب عمل میباشد و منجر به شکست در رسیدن به هد میشود. ( ) ( ( ) ( ) ) ) 2( 228

4 شکل) (: مثالی از مقادیر Q اشتباه. موقعیت هدف با G مشخص شده است. عامل در موقعیت x قرار دارد عمل a را انجام میدهد به حالت 'x منتقل میشود پاداش دریافت میکند و همزمان برای عمل متضاد مجازات میشود. بنابراین مقادیر Q این حالتها اشتباه میباشد. 3- روش کار --3 بهروز رسانی مقادیرQ در روش پیشنهادی مقادیر Q بهروز رسانی میشود. برای هر جفت حالت- عمل مطابت فرمول )( Q(s, a) Q(s, a) + α [r + γ max aˈq(sˈ, ˈ) + (-γ)min a Q(sˈ, ) - Q(s, a)] ) ( شرط الزم برای همگرایی مقادیرQها این است که +t max aˈq(sˈ, aˈ)=q و Qˈt+ min a Q(sˈ, ( a = دارای مقادیر رابتی باشند یا به عبار دیگر مقادیرQها با +t Q و Qˈt+ تغییر کند بنابراین داریم: Q t = (-α) Q t + α ( + γ Q t+ + (- γ)qˈt+) :گام اول γ)qˈt+) Q t = (-α) 2 Q t + (-α) α( + γ Q t+ + (- :گام دوم + α ( + γ Q t+ + (- γ)qˈt+)... γ)qˈt+) Q t = (-α) n Q t +(-α) n- α( + γ Q t+ + (- :گامnام + (-α) n-2 α( + γ Q t+ + (- γ)qˈt+) + + α( + γ Q t+ + (- γ) Qˈt+) = (-α) n Q t + α( + γ Q t+ + (- γ)qˈt+) [(-α) n- +(-α) n-2 + +] = (-α) n Q t + ( + γ Q t+ + (- γ)qˈt+))-(-α) n ( چون 0 < α < 0 < -α < (-α) n 0, Q t = + γ Q t+ + (- γ) Qˈt+ مقدارQ با بهروز رسانی کافی همگرا میشود. در روش پیشنهادی عامل مقادیر Q را برای هر عمل و عمل متضاد متناظر با آن بهروز رسانی میکند. عمل متضاد دارای جهتی مخالف جهت عمل اصلی میباشد. بهعنوان مثال هنگامیکه عمل اصلی دارای جهت رو به باال است جهت عمل متضاد متناظر با آن رو به پایین است. روش پیشنهادی نیز بطور همزمان دو مقدار از جدول Q را برای مقادیر حالت- عمل و حالت - عمل متضاد بهروز رسانی میکند. تابا پاداش به صور ماتریسی از حالت - عمل در نظر گرفته شده است. با فرض اینکه عامل در جهت دلخواه باشد ارزش حالت- عمل متضاد با دریافت پاداش جفت حالت عمل متضاد برای عمل با کمترین ارزش ضری باالتری نسبت به عملی که بیشترین ارزش در حالت بعدی را دارد درنظر میگیرد. در روش پیشنهادی دو مقدار Q مطابت )8( بهروز رسانی میشود. Q(s, a) Q(s, a) + α[r(s, a) + γ max aˈ Q(sˈ, aˈ) + (- γ) min Q(sˈ, ) - Q(s, a)] Q(s, ) Q(s, ) + α (s, ) + γ min aˈ Q(sˈ, aˈ) + (- γ) m x Q(sˈ, ) - Q(s, )] ) 8( 2-3- استراتژی انتخاو عمل رفتار عامل در هر زمان توسط رویه عمل تعریف میشود که به بیانی دیگر حالت را به عمل نگاشت میکند. اپسیلون- گریدی و سافتمکس دو رویه معرو هستند که اغل مورد استفاده قرار میگیرند []. در رویه اپسیلون- گریدی در هر گام زمانی عمل تصادفی با احتمال رابت ɛ 0 و عمل با باالترین ارزش با احتمال ɛ- انتخاب میشود که این نوع انتخاب عمل به عنوان انتخاب حریصانه شناخته میشود. اگرچه رویه اپسیلون- گریدی به دفعا مورد استفاده قرار میگیرد یکی از اشکالهای این رویه درنظر گرفتن احتمال مساوی برای انتخاب عملهای غیر بهینه است. در رویه سافتمکس احتمال انتخاب عمل ربت فرمول )9( درنظر گرفته میشود: Pa ( ) a j A ( s ) Q ( s, a) e Q ( s, a j ) e ) 9( که در آن ضری دما میباشد که مقدار آن مثبت است []. اکتشا بر پایه تفاضل ارزش که با انتخاب عمل سافتمکس ترکی میشود بهعنوان یک رویه تطبیقی برای روشهای یادگیری تفاضل زمانی مطرح شده است که آن را VDBE-Softmax 2 نامیدهاند. تفاو توزیا بولتزمن مقادیر قبل و بعد از یادگیری ربت رابطه )( محاسبه میشود [7]. f ( s, a, ) Qt ( s, a) Qt ( s, a) e e Qt ( s, a) Qt ( s, a) Qt ( s, a) Qt ( s, a) e e e e e e.. )( که σ رابت مثبت میباشد. از مزایای این δ روش این است که عملهای اکتشافی در موقعیتهایی که مقادیر ارزش در فرایند یادگیری دارای نوسان است و دانش در مورد محیط به قطعیت نرسیده است انتخاب میشود. در آغاز فرایند یادگیری انتظار میرود عامل بیشتر اکتشا انجام دهد و زمانیکه عامل به شناختی از محیط برسد مقدار اکتشا کاهش یابد. چنین رفتار انطباقی با استفاده از محاسبه احتمال اکتشا وابسته به حالت بعد از هر گام یادگیری مانند )( محاسبه میشود. ɛ t+ (s)= δ. f(s t, a t, σ) + (-δ). ɛ t (s) )( میباشد که در آن A(s) تعداد عملها میباشد. (s) ɛ برای تمامی حالتها در آغاز با یک مقدار دهی شده است[ 7 ]. 229

5 در روش پیشنهاد شده برای محاسبه احتمال اکتشا وابسته به حالت 4- آزمایشها و ارزیابی فرمول) 2 ( میانگینی از (σ f(s,,a و (σ f(s,, درنظر گرفته شده است. به منظور مقایسه روش پیشنهاد شده (OQL-VDBE( با روشهای تضاد قبلی[ 5 ] روش [7] QL-VDBE-softmax و روش یادگیریQ استاندارد دو Grid world نشان داده شده در شکل) 3 ( استفاده شده است. انتخاب عمل نیز بوسیله رویه سافتمکس انجام شده است. عامل در هر دوره بهصور تصادفی در یکی از خانههای سفید رنگ نشان داده شده در شکل) 3 ( یادگیری را آغاز میکند. در هر قدم عامل میتواند در یکی از هشت جهت که شامل: شمال شمال شرق شرق جنوب شرق جنوب جنوب غرب غرب و شمال غرب است باشد. عامل مسیر را برای رسیدن به خانه هد که با G مشخص شده پیمایش میکند. هد از یادگیری این است که عامل بتواند با پرداخت کمترین هزینه به خانه هد برسد. فرض شده که هر حرکت پاداشی به اندازه - دارد. حرکتهایی که باعث برخورد عامل به مانا یا دیوار میشود محل عامل را تغییر نمیدهد و پاداش - را در پی دارد. زمانیکه عامل به خانه هد برسد پاداش + دریافت میکند. برای پیاده سازی پژوهش پیشین مبتنی بر تضاد از تابا پاداش ذکر شده در پژوهش [5] استفاده شده است. به منظور مقایسه روشها نرخ موفقیت میانگین درصد حالتهای بهینه و متوسط تعداد گامهای عامل برای رسیدن به هد به عنوان معیارهای اندازهگیری درنظر گرفته شده است. نرخ موفقیت مطابت) 3 ( محاسبه میشود. n s ) 3( epoch max_episode که n s تعداد دفعاتی است که عامل توانسته به خانه هد برسد. مخرج تعداد دفعاتی که روشها برای هر محیط اجرا شده است را نشان میدهد که شامل تعداد تکرار در تعداد دورهها میباشد. هر دوره یادگیری زمانیکه عامل به خانه هد برسد یا به حداکثر تعداد حرکا درنظر گرفته شده برای هر محیط برسد پایان مییابد. پارامترهای استفاده شده برای تمامی پیاده سازیها در جدول) ( آورده شده است. درصد نرخ موفقیت در جدول) 2 ( نشان داده شده است. جدول ) ) : مقداردهی پارامترها پارامتر حداکثر تعداد گام در محیط حداکثر تعداد گام در محیط )ب( تعداد دوره تعداد تکرار دما )( δ σ اندازه /./25 روش ها جدول) 2 (: درصد نرخ موفقیت محیط )ب( محیط α= / 8 α= / 3 α= / α= / 8 α= / 3 α= / γ= / 9 γ= / 8 γ= / γ= / 9 γ= / 8 γ= / 96 /32 83 / 3 6 / / 4 98 / 89 / 95 QL 9 /2 93 / 26 9 / / / / 6 QL_VDBE /23 4 / 5 2 / 28 / 3 / 24 / 8 OQL /93 / 5 / 6 3 / 65 / 88 / 36 OQL2 4 /45 9 / / 4 6 / 6 6 / / 2 OQL3 9 /63 9 / 94 / 6 99 / 6 99 / / 6 OQL-VDBE e f ( s, a, ) e.. r ( s, a) max Q ( s ', a ') ( ) min Q ( s ', a") Q ( s, a) a' a'' e f ( s, a, ) e r ( s, a) min Q ( s ', a ') ( ) max Q ( s ', a") Q ( s, a) 2 a' a'' t ( s ).( f ( s, a, ) f ( s, a, )) ( ). t ( s ) 2 )2( الگوریتم اصلی این مقاله در ادامه با عنوان الگوریتم )( ارائه شده است. الگوریتم) (: OQL-VDBE. Initialize Q(s, a) arbitrarily 2. Initialize e(s) arbitrarily, e.g. ( s ) = for all s 3. Repeat (for each episode): 4. Initialize s 5. Repeat (for each step of episode): 6. ξ rand(0..) 7. if ξ < ɛ(s) then 8. softm x(a(s)) 9. else 0. gm x bϵa(s) Q(s, b). endif 2. Take action a, observe reward r and next state s' 3. Determine opposite action a 4. a * argmax i ϵ A(sˈ) Q(sˈ, i) 5. * argmin j ϵ A(sˈ) Q(sˈ, j) 6. = (s, ) + γq(sˈ, a * ) + (-γ)q(sˈ, * ) - Q(s,a) 7. 2 = (s, ) + γq(sˈ, * ) + (-γ)q(sˈ, * ) - Q(s, ) 8. 3 = (s, ) + γq(sˈ, * ) + (-γ)q(sˈ, * ) - Q(s,a) 9. 4 = (s, ) + γq(sˈ, * ) + (-γ)q(sˈ, * ) - Q(s, ) 20. if Q(s, ) < Q(sˈ, a * ) 2. Q(s, a) = Q(s, ) + α. 22. Q(s, ) = Q(s, ) + α ( 24. else 25. Q(s, ) = Q(s, ) + α Q(s, ) = Q(s, ) + α ( ) ) 28. endif 29. s sˈ 30. until s is terminal state 3. until a desired number of episode terminated 230

6 و) عمل ها ) آ) ) شکل) 3 (: نمایی از دو محیط شبیهسازی. موقعیت شروع یکی از خانههای سفید رنگ میباشد و موقعیت هدف با G مشیخص شیده اسیت. عامیل میتواند در هشت جهت حرکت کند. شکل)آ(: محیط شکل)و(: محیط درصد نرخ موفقیت آمده در جدول )2( نشان میدهد که این ندرخ بدرای روش پیشنهادی )OQL-VDBE( دارای مقادیر بیشتری مدیباشدد. اگرچده کارهای مبتنی بر تضاد قبلی OQL( OQL2 و )OQL3 در محیطهدای بدون مانا به خوبی جواب میدهد و باعث افزایش سرعت یادگیری مدیشدود اما در محیطهایی که مانا وجود دارد بهدلیل وجود مقادیر Q اشتباه منجر بده شکست در رسیدن به هد میشود. درصد حالتهای بهینه با درنظر گرفتن نسبت بین تعداد گامهای مسدیر بهینه به تعداد گامهای موجود در مسیر هر روش اندازهگیری مدیشدود [5]. به منظور مقایسه روشها درصد حالتهای بهینه و تعداد گامهدای عامدل در رسیدن به هد در هر دوره یادگیری ربت شدده اسدت. پدس از پایدان یدافتن دورهها فرایند یادگیری برای تمدامی روشهدا 5 مرتبده تکدرار شدده اسدت. میانگین درصد بهینه و متوسط تعداد گامها گزارش شده است. ارزیابی روش پیشدنهاد شدده بدا پدژوهشهدای پیشدین در شدکلهدای )4-9( نشان داده شده است. درصد حالتهای بهینه در شکلهای) ( و متوسط تعداد گامهای عامل تا رسیدن به هد در شکلهای )5 9( برای دو محیط نشان داده شده است. در شکلهای ذکر شده زیرنویس)آ( نتایج به دست آمده برای محیط را نشان میدهد و زیرنویس )ب( متناظر با نتایج به دست آمده در محیط )ب( میباشد. شکل 4 آ) ( نتایج فرایند یادگیری را بدا پارامترهدای / =α /=γ و تعداد دوره 4 برای شش روش نشان میدهد. میانگین درصد حالت بهینه در روش پیشنهاد شده دارای مقادیر باالتری نسبت به دیگدر روشهدا مدیباشدد. دلیل این بهبود این است که عامل مسیر کوتاهتری را برای رسیدن به هدد پیمایش میکند. روش پیشنهاد شدده (OQL_VDBE) چدون در هدر گدام یادگیری بطور همزمان دو مقدار از مقادیر Q را بهروز میکند نسبت به روش QL_VDBE برتری دارد. روش QL_VDBE نیز بهدلیل بهبدود سیاسدت انتخاب عمل از روش QL بهتر عمل مدیکندد. روشهدای مبتندی بدر تضداد (OQL,OQL2,OQL3) به دلیل انتساب پاداشهای اشتباه باعدث ورود مقادیر اشتباه به جددول Q مدیشدوند. بندابراین عامدل در بسدیاری از مدوارد نمیتواند به خانه هد برسد و برای به پایان رساندن فرایند یادگیری در هر دوره حداکثر تعداد گامهای درنظر گرفته شده را ری میکند. شکل 4 ب) ( فرایند یادگیری را برای محیط )ب( نشان میدهد. همانرور که دیده میشود درصد حالت بهینه نسبت به محیط کمتر شده است چدون محیط )ب( دارای تعداد حالتهای بیشتری نسبت به محیط میباشد. شکل 5 آ) ) و 5 ب) ) متوسط تعداد گامهای عامل تا هد را برای دو محیط نشان میدهد. روش ارائه شده نسبت به روشهای دیگر بهتر عمل میکند. همانگونه که دیده میشود روش پیشنهادی با تعداد گامهای کمتری به خانده هد میرسد. همین بهبود حاصل شده منجر بده افدزایش سدرعت یدادگیری میشود. برای کارایی الگدوریتم آزمدایشهدا بدا پارامترهدای =α /3 /8=γ و =α /8 /9=γ تکرار شده است. نتایج در شدکلهدای )6-9( آورده شدده است. با افزایش این پارامترها فرایند یادگیری نیز بهبود یافته است. همانرور که در شکلهای) ( بدرای دو محدیط مشداهده مدیشدود درصد حالتهای بهینه در روش پیشنهاد شده در این مقاله به ردور میدانگین مطابت جدول) 3 ( نسبت به روشهدای QL و QL_VDBE افدزایش یافتده است. که دلیل این افزایش همانگونه که در بخش 3 اشاره شده اسدت مدوارد مانند: افزایش تعداد بهروز رسانی و بهبود استراتژی انتخداب عمدل مدیباشدد. همانرور که قبال ذکر شد درصد حالت بهینده نسدبت بدین تعدداد گدامهدای کوتاهترین مسیر موجود به تعداد گامهای موجود در مسیر هر روش میباشدد. سه روش ذکر شده در پژوهش[ 5 ] در بسیاری از موارد نمیتوانند به خانه هد برسند. بنابراین به دلیل عملکرد ضعیف در جدول) 3 ( از نشان دادن نتدایج آن خودداری شده است. برای مثال در شکلهدای )4 6 8( عملکدرد ضدعیف ایدن روشها قابل مشاهده است. روش جدول) 3 (: مقایسهی نرخ بهبود محیط)ب ) محیط )آ ) α= / 8 α= / 3 α= / α= / 8 α= / 3 α= / γ= / 9 γ= / 8 γ= / γ= / 9 γ= / 8 γ= / /4 / 48 2 / / / 38 9 / 24 QL 8 /82 6 / 48 2 / 4 32 / 6 6 / 58 / 4 QL_VDBE 5- نتیجه گیری در مقاله ارائه شده الگوریتمی برای افزایش سرعت یادگیری Q مطرح شده است. در الگوریتم ارائه شده از روشی ترکیبی بر پایه افزایش تعداد بهروز رسانی مقادیر Q و بهبود انتخاب عمل استفاده شده است. ارزیابی روش ارائه شده به وسیله مقداردهی گوناگون پارامترهای تاریرگذار در دو محیط انجام گرفته شد. نتایج به دست آمده حاکی بر بهبود فرایند یادگیری و تسریا در آن میباشد. با توجه به اینکه یادگیری تقویتی دارای روشهای مختلفی میباشد و در این مقاله یادگیری Q مد نظر گرفته شده است الگوریتم ارائه شده میتواند در روشهای دیگر یادگیری تقویتی به عنوان کار آتی مطرح باشد. 23

7 و) α=. / شکل) 4 (: مقایسه عملکرد یادگیری با و 7/. =γ. تعداد دورهها به میانگین درصد حالتهای بهینه در دو محیط و شکل) 5 (: مقایسه عملکرد یادگیری با /.=α ) و 7/. =γ. تعداد دورهها به متوسط تعداد گامهای عامل تا هدف در دو محیط و شکل) 6 (: مقایسه عملکرد یادگیری با 3/.=α و 4/. =γ. تعداد دورهها به میانگین درصد حالتهای بهینه در دو محیط و شکل) 7 (: مقایسه عملکرد یادگیری با 3/.=α و 4/. =γ. تعداد دورهها به متوسط تعداد گامهای عامل تا هدف در دو محیط و 232

8 شکل) 4 (: مقایسه عملکرد یادگیری با 4/.=α و 9/. =γ. تعداد دورهها به میانگین درصد حالتهای بهینه در دو محیط و شکل) 9 (: مقایسه عملکرد یادگیری با 4/.=α و 9/. =γ. تعداد دورهها به متوسط تعداد گامهای عامل تا هدف در دو محیط و [] Song, Y., Li, Y. B., Li, C. H., and Zhang, G. F. "An effcient initialization approach of Q-learning for mobile robots". International Journal of Control, Automation and Systems, 0:66 72, 202. [2] Pandey, P., Pandey, D., and Kumar, S. "Reinforcement learning by comparing immediate reward", IJCSIS, vol. 8, no. 5, pp. -5, August 200. [3] Manju, S., and Punithavalli, M. "An analysis of Q- learning algorithms with strategies of reward function", IJCSE, vol. 3, no. 2, pp , February 20. [4] Mataric, M. J. "Reward functions for accelerated learning, " Proc. of the International Conference on Machine Learning, pp. 8-89, 994. [5] Guo, M., Liu, Y., and Malec, J. "A new Q-learning algorithm based on the metropolis criterion. " IEEE Trans. Syst. Man Cybern. B, 34(5): , [6] Tokic, M. "Adaptive ε-greedy exploration in reinforcement learning based on value differences". In: LNCS, vol. 6359, pp Springer, Heidelberg [7] Tokic, M. and Palm, G. "Value-difference based exploration: Adaptive exploration between epsilon-greedy and softmax. " In KI 20: Advances in Artificial Intelligence, Springer Berlin / Heidelberg. 20. [8] Watkins, C. J. C. H., Learning from Delayed Rewards, PhD thesis, Cambridge University, Cambridge, England, 989. زیرنویسها 2 Opposite Q-learning Value Difference Based Exploration - Softmax مراجع [] Sutton, R.S., Barto A.G., Reinforcement learning: An Introduction, MIT Press, Cambridge, MA, 998. [2] Peng, J., Williams, R. J. "Incremental multi-step Q- learning." Machine Learning, 22(-3), , 996. [3] Ma, X., Xu, Y., Sun, G. Q., Deng, L. X., and Li, Y. B. "State-chain sequential feedback reinforcement learning for path planning of autonomous mobile robots." Journal of Zhejiang University Science C, 4(3), 67-78, 203. [4] Tizhoosh, H. R. "Reinforcement learning based on actions and opposite actions." In International Conference on Artificial Intelligence and Machine Learning (pp ), [5] Tizhoosh, H. R. "Opposition-based reinforcement learning", Journal of Advanced Computational Intelligence and Intelligent Informatics 0 (4), , [6] Senda, K., Mano, S., and Fujii, S. "A Reinforcement Learning Accelerated by State Space Reduction". SICE Annual Conf., pp: , [7] Hamagami, T., and Hirata, H. "An Adjustment Method of the Number of States of Q-Learning Segmenting State Space Adaptively". Proc. IEEE Int. Conf. on Systems, Man and Cybernetics, pp: , [8] Lampton, A., and Valasek, J. "Multiresolution State-Space Discretization Method for Q-Learning. " Proc. American Control Conf., p , [9] Ribeiro, C. H. "Embedding a priori knowledge in reinforcement learning", Journal of Intelligent and Robotic Systems 2, pp: [0] Terashima, K., and Murata, J. "A study on Use of Prior Information for Acceleration of Reinforcement Learning", SICE Annual Conf. 20, pp ,

محاسبه ی برآیند بردارها به روش تحلیلی

محاسبه ی برآیند بردارها به روش تحلیلی محاسبه ی برآیند بردارها به روش تحلیلی برای محاسبه ی برآیند بردارها به روش تحلیلی باید توانایی تجزیه ی یک بردار در دو راستا ( محور x ها و محور y ها ) را داشته باشیم. به بردارهای تجزیه شده در راستای محور

Διαβάστε περισσότερα

روش محاسبه ی توان منابع جریان و منابع ولتاژ

روش محاسبه ی توان منابع جریان و منابع ولتاژ روش محاسبه ی توان منابع جریان و منابع ولتاژ ابتدا شرح کامل محاسبه ی توان منابع جریان: برای محاسبه ی توان منابع جریان نخست باید ولتاژ این عناصر را بدست آوریم و سپس با استفاده از رابطه ی p = v. i توان این

Διαβάστε περισσότερα

آزمایش 8: تقویت کننده عملیاتی 2

آزمایش 8: تقویت کننده عملیاتی 2 آزمایش 8: تقویت کننده عملیاتی 2 1-8 -مقدمه 1 تقویت کننده عملیاتی (OpAmp) داراي دو یا چند طبقه تقویت کننده تفاضلی است که خروجی- هاي هر طبقه به وروديهاي طبقه دیگر متصل شده است. در انتهاي این تقویت کننده

Διαβάστε περισσότερα

ﯽﺳﻮﻃ ﺮﯿﺼﻧ ﻪﺟاﻮﺧ ﯽﺘﻌﻨﺻ هﺎﮕﺸﻧاد

ﯽﺳﻮﻃ ﺮﯿﺼﻧ ﻪﺟاﻮﺧ ﯽﺘﻌﻨﺻ هﺎﮕﺸﻧاد دانشگاه صنعتی خواجه نصیر طوسی دانشکده برق - گروه کنترل آزمایشگاه کنترل سیستمهای خطی گزارش کار نمونه تابستان 383 به نام خدا گزارش کار آزمایش اول عنوان آزمایش: آشنایی با نحوه پیاده سازی الکترونیکی فرایندها

Διαβάστε περισσότερα

تصاویر استریوگرافی.

تصاویر استریوگرافی. هب انم خدا تصاویر استریوگرافی تصویر استریوگرافی یک روش ترسیمی است که به وسیله آن ارتباط زاویه ای بین جهات و صفحات بلوری یک کریستال را در یک فضای دو بعدی )صفحه کاغذ( تعیین میکنند. کاربردها بررسی ناهمسانگردی

Διαβάστε περισσότερα

جلسه ی ۱۰: الگوریتم مرتب سازی سریع

جلسه ی ۱۰: الگوریتم مرتب سازی سریع دانشکده ی علوم ریاضی داده ساختارها و الگوریتم ها ۸ مهر ۹ جلسه ی ۱۰: الگوریتم مرتب سازی سریع مدر س: دکتر شهرام خزاي ی نگارنده: محمد امین ادر یسی و سینا منصور لکورج ۱ شرح الگور یتم الگوریتم مرتب سازی سریع

Διαβάστε περισσότερα

آزمون مقایسه میانگین های دو جامعه )نمونه های بزرگ(

آزمون مقایسه میانگین های دو جامعه )نمونه های بزرگ( آزمون مقایسه میانگین های دو جامعه )نمونه های بزرگ( فرض کنید جمعیت یک دارای میانگین و انحراف معیار اندازه µ و انحراف معیار σ باشد و جمعیت 2 دارای میانگین µ2 σ2 باشند نمونه های تصادفی مستقل از این دو جامعه

Διαβάστε περισσότερα

آزمایش 1: پاسخ فرکانسی تقویتکننده امیتر مشترك

آزمایش 1: پاسخ فرکانسی تقویتکننده امیتر مشترك آزمایش : پاسخ فرکانسی تقویتکننده امیتر مشترك -- مقدمه هدف از این آزمایش بدست آوردن فرکانس قطع بالاي تقویتکننده امیتر مشترك بررسی عوامل تاثیرگذار و محدودکننده این پارامتر است. شکل - : مفهوم پهناي باند تقویت

Διαβάστε περισσότερα

6- روش های گرادیان مبنا< سر فصل مطالب

6- روش های گرادیان مبنا< سر فصل مطالب 1 بنام خدا بهینه سازی شبیه سازی Simulation Optimization Lecture 6 روش های بهینه سازی شبیه سازی گرادیان مبنا Gradient-based Simulation Optimization methods 6- روش های گرادیان مبنا< سر فصل مطالب 2 شماره

Διαβάστε περισσότερα

مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل

مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل شما باید بعد از مطالعه ی این جزوه با مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل کامال آشنا شوید. VA R VB به نظر شما افت ولتاژ مقاومت R چیست جواب: به مقدار عددی V A

Διαβάστε περισσότερα

1- مقدمه. 2 Action. 1 Heuristic

1- مقدمه. 2 Action. 1 Heuristic یک الگوریتم نوین جهت رنگ آمیزی گراف با استفاده از آتوماتای یادگیر حبیب مطیع قادر دانشگاه آزاد اسلامی واحد تبریز باشگاه پژوهشگران جوان Habib_moti@yahoo.com عباس میرزایی ثمرین بورسیه هیات علمی دانشگاه آزاد

Διαβάστε περισσότερα

تخمین با معیار مربع خطا: حالت صفر: X: مکان هواپیما بدون مشاهده X را تخمین بزنیم. بهترین تخمین مقداری است که متوسط مربع خطا مینیمم باشد:

تخمین با معیار مربع خطا: حالت صفر: X: مکان هواپیما بدون مشاهده X را تخمین بزنیم. بهترین تخمین مقداری است که متوسط مربع خطا مینیمم باشد: تخمین با معیار مربع خطا: هدف: با مشاهده X Y را حدس بزنیم. :y X: مکان هواپیما مثال: مشاهده نقطه ( مجموعه نقاط کنارهم ) روی رادار - فرض کنیم می دانیم توزیع احتمال X به چه صورت است. حالت صفر: بدون مشاهده

Διαβάστε περισσότερα

تلفات خط انتقال ابررسی یک شبکة قدرت با 2 به شبکة شکل زیر توجه کنید. ژنراتور فرضیات شبکه: میباشد. تلفات خط انتقال با مربع توان انتقالی متناسب

تلفات خط انتقال ابررسی یک شبکة قدرت با 2 به شبکة شکل زیر توجه کنید. ژنراتور فرضیات شبکه: میباشد. تلفات خط انتقال با مربع توان انتقالی متناسب تلفات خط انتقال ابررسی یک شبکة قدرت با 2 به شبکة شکل زیر توجه کنید. ژنراتور فرضیات شبکه: این شبکه دارای دو واحد کامال یکسان آنها 400 MW میباشد. است تلفات خط انتقال با مربع توان انتقالی متناسب و حداکثر

Διαβάστε περισσότερα

پروژه یازدهم: ماشین هاي بردار پشتیبان

پروژه یازدهم: ماشین هاي بردار پشتیبان پروژه یازدهم: ماشین هاي بردار پشتیبان 1 عموما براي مسایلی که در آنها دو دسته وجود دارد استفاده میشوند اما ماشین هاي بردار پشتیبان روشهاي متفاوتی براي ترکیب چند SVM و ایجاد یک الگوریتم دستهبندي چند کلاس

Διαβάστε περισσότερα

مثال( مساله الپالس در ناحیه داده شده را حل کنید. u(x,0)=f(x) f(x) حل: به کمک جداسازی متغیرها: ثابت = k. u(x,y)=x(x)y(y) X"Y=-XY" X" X" kx = 0

مثال( مساله الپالس در ناحیه داده شده را حل کنید. u(x,0)=f(x) f(x) حل: به کمک جداسازی متغیرها: ثابت = k. u(x,y)=x(x)y(y) XY=-XY X X kx = 0 مثال( مساله الپالس در ناحیه داده شده را حل کنید. (,)=() > > < π () حل: به کمک جداسازی متغیرها: + = (,)=X()Y() X"Y=-XY" X" = Y" ثابت = k X Y X" kx = { Y" + ky = X() =, X(π) = X" kx = { X() = X(π) = معادله

Διαβάστε περισσότερα

جلسه 3 ابتدا نکته اي در مورد عمل توابع بر روي ماتریس ها گفته می شود و در ادامه ي این جلسه اصول مکانیک کوانتمی بیان. d 1. i=0. i=0. λ 2 i v i v i.

جلسه 3 ابتدا نکته اي در مورد عمل توابع بر روي ماتریس ها گفته می شود و در ادامه ي این جلسه اصول مکانیک کوانتمی بیان. d 1. i=0. i=0. λ 2 i v i v i. محاسبات کوانتمی (671) ترم بهار 1390-1391 مدرس: سلمان ابوالفتح بیگی نویسنده: محمد جواد داوري جلسه 3 می شود. ابتدا نکته اي در مورد عمل توابع بر روي ماتریس ها گفته می شود و در ادامه ي این جلسه اصول مکانیک

Διαβάστε περισσότερα

جلسه ی ۵: حل روابط بازگشتی

جلسه ی ۵: حل روابط بازگشتی دانشکده ی علوم ریاضی ساختمان داده ها ۶ مهر ۲ جلسه ی ۵: حل روابط بازگشتی مدر س: دکتر شهرام خزاي ی نگارنده: ا رمیتا ثابتی اشرف و علی رضا علی ا بادیان ۱ مقدمه پیدا کردن کران مجانبی توابع معمولا با پیچیدگی

Διαβάστε περισσότερα

فصل چهارم : مولتی ویبراتورهای ترانزیستوری مقدمه: فیدبک مثبت

فصل چهارم : مولتی ویبراتورهای ترانزیستوری مقدمه: فیدبک مثبت فصل چهارم : مولتی ویبراتورهای ترانزیستوری مقدمه: فیدبک مثبت در تقویت کننده ها از فیدبک منفی استفاده می نمودیم تا بهره خیلی باال نرفته و سیستم پایدار بماند ولی در فیدبک مثبت هدف فقط باال بردن بهره است در

Διαβάστε περισσότερα

Nonparametric Shewhart-Type Signed-Rank Control Chart with Variable Sampling Interval

Nonparametric Shewhart-Type Signed-Rank Control Chart with Variable Sampling Interval International Journal of Industrial Engineering & Production Management 2013) ugust 2013, Volume 24, Number 2 pp. 183-189 http://ijiepm.iust.ac.ir/ Nonparametric Shewhart-Type Signed-Rank Control Chart

Διαβάστε περισσότερα

Answers to Problem Set 5

Answers to Problem Set 5 Answers to Problem Set 5 Principle of Economics Graduate School of Management and Economics, Sharif University of Technology Fall 94 5. Suppose a competitive firm has the following cost function c(y) =

Διαβάστε περισσότερα

جلسه ی ۳: نزدیک ترین زوج نقاط

جلسه ی ۳: نزدیک ترین زوج نقاط دانشکده ی علوم ریاضی ا نالیز الگوریتم ها ۴ بهمن ۱۳۹۱ جلسه ی ۳: نزدیک ترین زوج نقاط مدر س: دکتر شهرام خزاي ی نگارنده: امیر سیوانی اصل ۱ پیدا کردن نزدیک ترین زوج نقطه فرض می کنیم n نقطه داریم و می خواهیم

Διαβάστε περισσότερα

جلسه 14 را نیز تعریف کرد. عملگري که به دنبال آن هستیم باید ماتریس چگالی مربوط به یک توزیع را به ماتریس چگالی مربوط به توزیع حاشیه اي آن ببرد.

جلسه 14 را نیز تعریف کرد. عملگري که به دنبال آن هستیم باید ماتریس چگالی مربوط به یک توزیع را به ماتریس چگالی مربوط به توزیع حاشیه اي آن ببرد. تي وري اطلاعات کوانتمی ترم پاییز 39-39 مدرس: ابوالفتح بیگی و امین زاده گوهري نویسنده: کامران کیخسروي جلسه فرض کنید حالت سیستم ترکیبی AB را داشته باشیم. حالت سیستم B به تنهایی چیست در ابتداي درس که حالات

Διαβάστε περισσότερα

تحلیل مدار به روش جریان حلقه

تحلیل مدار به روش جریان حلقه تحلیل مدار به روش جریان حلقه برای حل مدار به روش جریان حلقه باید مراحل زیر را طی کنیم: مرحله ی 1: مدار را تا حد امکان ساده می کنیم)مراقب باشید شاخه هایی را که ترکیب می کنید مورد سوال مسئله نباشد که در

Διαβάστε περισσότερα

الکترونیکی: پست پورمظفری

الکترونیکی: پست پورمظفری 95/08/06 مقاله: دریافت تاریخ 95/11/20 مقاله: پذیرش تاریخ پایین مصرفی توان با به 2 5 و به 2 4 کمپرسورهای طراحی * گوابر داداشی مرتضی ايران تهران- امیرکبیر صنعتی دانشگاه اطالعات فناوری و کامپیوتر مهندسی دانشکده

Διαβάστε περισσότερα

طراحی و تعیین استراتژی بهره برداری از سیستم ترکیبی توربین بادی-فتوولتاییک بر مبنای کنترل اولیه و ثانویه به منظور بهبود مشخصههای پایداری ریزشبکه

طراحی و تعیین استراتژی بهره برداری از سیستم ترکیبی توربین بادی-فتوولتاییک بر مبنای کنترل اولیه و ثانویه به منظور بهبود مشخصههای پایداری ریزشبکه طراحی و تعیین استراتژی بهره برداری از سیستم ترکیبی توربین بادی-فتوولتاییک بر مبنای کنترل اولیه و ثانویه به منظور بهبود مشخصههای پایداری ریزشبکه 2 1* فرانک معتمدی فرید شیخ االسالم 1 -دانشجوی دانشکده برق

Διαβάστε περισσότερα

شاخصهای پراکندگی دامنهی تغییرات:

شاخصهای پراکندگی دامنهی تغییرات: شاخصهای پراکندگی شاخصهای پراکندگی بیانگر میزان پراکندگی دادههای آماری میباشند. مهمترین شاخصهای پراکندگی عبارتند از: دامنهی تغییرات واریانس انحراف معیار و ضریب تغییرات. دامنهی تغییرات: اختالف بزرگترین و

Διαβάστε περισσότερα

جلسه ی ۴: تحلیل مجانبی الگوریتم ها

جلسه ی ۴: تحلیل مجانبی الگوریتم ها دانشکده ی علوم ریاضی ساختمان داده ها ۲ مهر ۱۳۹۲ جلسه ی ۴: تحلیل مجانبی الگوریتم ها مدر س: دکتر شهرام خزاي ی نگارنده: شراره عز ت نژاد ا رمیتا ثابتی اشرف ۱ مقدمه الگوریتم ابزاری است که از ا ن برای حل مسا

Διαβάστε περισσότερα

جلسه ی ۲۴: ماشین تورینگ

جلسه ی ۲۴: ماشین تورینگ دانشکده ی علوم ریاضی نظریه ی زبان ها و اتوماتا ۲۶ ا ذرماه ۱۳۹۱ جلسه ی ۲۴: ماشین تورینگ مدر س: دکتر شهرام خزاي ی نگارندگان: حمید ملک و امین خسر وشاهی ۱ ماشین تور ینگ تعریف ۱ (تعریف غیررسمی ماشین تورینگ)

Διαβάστε περισσότερα

5- مروری بر روش های جستجوی تصادفی > سر فصل مطالب

5- مروری بر روش های جستجوی تصادفی > سر فصل مطالب 1 بنام خدا بهینه سازی شبیه سازی Simulation Optimization Lecture 5 مروری بر روش های جستجوی تصادفی A review of random search methods 5- مروری بر روش های جستجوی تصادفی > سر فصل مطالب 2 شماره عنوان فصل 1-5

Διαβάστε περισσότερα

بسم اهلل الرحمن الرحیم آزمایشگاه فیزیک )2( shimiomd

بسم اهلل الرحمن الرحیم آزمایشگاه فیزیک )2( shimiomd بسم اهلل الرحمن الرحیم آزمایشگاه فیزیک )( shimiomd خواندن مقاومت ها. بررسی قانون اهم برای مدارهای متوالی. 3. بررسی قانون اهم برای مدارهای موازی بدست آوردن مقاومت مجهول توسط پل وتسون 4. بدست آوردن مقاومت

Διαβάστε περισσότερα

همبستگی و رگرسیون در این مبحث هدف بررسی وجود یک رابطه بین دو یا چند متغیر می باشد لذا هدف اصلی این است که آیا بین

همبستگی و رگرسیون در این مبحث هدف بررسی وجود یک رابطه بین دو یا چند متغیر می باشد لذا هدف اصلی این است که آیا بین همبستگی و رگرسیون در این مبحث هدف بررسی وجود یک رابطه بین دو یا چند متغیر می باشد لذا هدف اصلی این است که آیا بین دو صفت متغیر x و y رابطه و همبستگی وجود دارد یا خیر و آیا می توان یک مدل ریاضی و یک رابطه

Διαβάστε περισσότερα

هو الحق دانشکده ي مهندسی کامپیوتر جلسه هفتم

هو الحق دانشکده ي مهندسی کامپیوتر جلسه هفتم هو الحق دانشکده ي مهندسی کامپیوتر کدگذاري شبکه Coding) (Network شنبه 2 اسفند 1393 جلسه هفتم استاد: مهدي جعفري نگارنده: سید محمدرضا تاجزاد تعریف 1 بهینه سازي محدب : هدف پیدا کردن مقدار بهینه یک تابع ) min

Διαβάστε περισσότερα

قاعده زنجیره ای برای مشتقات جزي ی (حالت اول) :

قاعده زنجیره ای برای مشتقات جزي ی (حالت اول) : ۱ گرادیان تابع (y :f(x, اگر f یک تابع دومتغیره باشد ا نگاه گرادیان f برداری است که به صورت زیر تعریف می شود f(x, y) = D ۱ f(x, y), D ۲ f(x, y) اگر رویه S نمایش تابع (y Z = f(x, باشد ا نگاه f در هر نقطه

Διαβάστε περισσότερα

دانشکده ی علوم ریاضی جلسه ی ۵: چند مثال

دانشکده ی علوم ریاضی جلسه ی ۵: چند مثال دانشکده ی علوم ریاضی احتمال و کاربردا ن ۴ اسفند ۹۲ جلسه ی : چند مثال مدر س: دکتر شهرام خزاي ی نگارنده: مهدی پاک طینت (تصحیح: قره داغی گیوه چی تفاق در این جلسه به بررسی و حل چند مثال از مطالب جلسات گذشته

Διαβάστε περισσότερα

جلسه ی ۱۸: درهم سازی سرتاسری - درخت جست و جوی دودویی

جلسه ی ۱۸: درهم سازی سرتاسری - درخت جست و جوی دودویی دانشکده ی علوم ریاضی ساختمان داده ۱۰ ا ذر ۹۲ جلسه ی ۱۸: درهم سازی سرتاسری - درخت جست و جوی دودویی مدر س: دکتر شهرام خزاي ی نگارنده: معین زمانی و ا رمیتا اردشیری ۱ یادا وری همان طور که درجلسات پیش مطرح

Διαβάστε περισσότερα

مکانيک جامدات ارائه و تحليل روش مناسب جهت افزایش استحکام اتصاالت چسبي در حالت حجم چسب یکسان

مکانيک جامدات ارائه و تحليل روش مناسب جهت افزایش استحکام اتصاالت چسبي در حالت حجم چسب یکسان پائیز 2931/ سال ششم/ شماره ویژه دوم فصلنامه علمي پژوهشي مهندسي مکانيک جامدات فصلنامه علمي پژوهشي مهندسي مکانيک جامدات www.jsme.ir ارائه و تحليل روش مناسب جهت افزایش استحکام اتصاالت چسبي در حالت حجم چسب

Διαβάστε περισσότερα

جلسه 12 به صورت دنباله اي از,0 1 نمایش داده شده اند در حین محاسبه ممکن است با خطا مواجه شده و یکی از بیت هاي آن. p 1

جلسه 12 به صورت دنباله اي از,0 1 نمایش داده شده اند در حین محاسبه ممکن است با خطا مواجه شده و یکی از بیت هاي آن. p 1 محاسبات کوانتمی (67) ترم بهار 390-39 مدرس: سلمان ابوالفتح بیگی نویسنده: سلمان ابوالفتح بیگی جلسه ذخیره پردازش و انتقال اطلاعات در دنیاي واقعی همواره در حضور خطا انجام می شود. مثلا اطلاعات کلاسیکی که به

Διαβάστε περισσότερα

شبکه های عصبی در کنترل

شبکه های عصبی در کنترل شبکه های عصبی در کنترل دانشگاه نجف آباد درس: کنترل هوشمند در فضای سایبرنتیک مدرس: حمید محمودیان مدل ریاضی نرون مدل ریاضی یک نرون ساده به صورت روبرو است P: مقدار کمیت ورودی b: مقدار بایاس )عرض از مبدا تابع

Διαβάστε περισσότερα

کاهش مرتبه سیستم های چند ورودی چند خروجی با استفاده از الگوریتم بهینه سازی توده ذرات فازی بهبود یافته

کاهش مرتبه سیستم های چند ورودی چند خروجی با استفاده از الگوریتم بهینه سازی توده ذرات فازی بهبود یافته همایش ملی برق و توسعه پایدار موسسه آموزش عالی خاوران کاهش مرتبه سیستم های چند ورودی چند خروجی با استفاده از الگوریتم بهینه سازی توده ذرات فازی بهبود یافته 1 سید محمد علم الهدایی 1- دانشجو کارشناسی ارشد

Διαβάστε περισσότερα

مدار معادل تونن و نورتن

مدار معادل تونن و نورتن مدار معادل تونن و نورتن در تمامی دستگاه های صوتی و تصویری اگرچه قطعات الکتریکی زیادی استفاده می شود ( مانند مقاومت سلف خازن دیود ترانزیستور IC ترانس و دهها قطعه ی دیگر...( اما هدف از طراحی چنین مداراتی

Διαβάστε περισσότερα

مارکوف 1.مقدمه: سید مهدی صفوی محمد میکاییلی محمد پویان چکیده ما با مطالعه مدل مخفی میدان تصادفی مارکوف از الگوریتم EM

مارکوف 1.مقدمه: سید مهدی صفوی محمد میکاییلی محمد پویان چکیده ما با مطالعه مدل مخفی میدان تصادفی مارکوف از الگوریتم EM و بخش بندی تصاویر براساس مارکوف مدل میدان تصادفی مخفی 3 سید مهدی صفوی محمد میکاییلی محمد پویان -دانشجو گروه مهندسی پزشکی دانشکده فنی مهندسی دانشگاه شاهد 3- عضوهیات علمی دانشیار گروه مهندسی پزشکی دانشکده

Διαβάστε περισσότερα

مسائل. 2 = (20)2 (1.96) 2 (5) 2 = 61.5 بنابراین اندازه ی نمونه الزم باید حداقل 62=n باشد.

مسائل. 2 = (20)2 (1.96) 2 (5) 2 = 61.5 بنابراین اندازه ی نمونه الزم باید حداقل 62=n باشد. ) مسائل مدیریت کارخانه پوشاک تصمیم دارد مطالعه ای به منظور تعیین میانگین پیشرفت کارگران کارخانه انجام دهد. اگر او در این مطالعه دقت برآورد را 5 نمره در نظر بگیرد و فرض کند مقدار انحراف معیار پیشرفت کاری

Διαβάστε περισσότερα

چکیده مقدمه کلید واژه ها:

چکیده مقدمه کلید واژه ها: چکیده طی دهه های گذشته سازمان های بسیاری در اقسا نقاط جهان سیستم برنامه ریزی منابع سازمانی ERP را اتخاذ کرده اند. در باره ی منافع حسابداری اتخاذ سیستم های سازمانی تحقیقات کمی در مقیاس جهانی انجام شده است.

Διαβάστε περισσότερα

Angle Resolved Photoemission Spectroscopy (ARPES)

Angle Resolved Photoemission Spectroscopy (ARPES) Angle Resolved Photoemission Spectroscopy (ARPES) روش ARPES روشی است تجربی که برای تعیین ساختار الکترونی مواد به کار می رود. این روش بر پایه اثر فوتوالکتریک است که توسط هرتز کشف شد: الکترونها می توانند

Διαβάστε περισσότερα

معادلهی مشخصه(کمکی) آن است. در اینجا سه وضعیت متفاوت برای ریشههای معادله مشخصه رخ میدهد:

معادلهی مشخصه(کمکی) آن است. در اینجا سه وضعیت متفاوت برای ریشههای معادله مشخصه رخ میدهد: شکل کلی معادلات همگن خطی مرتبه دوم با ضرایب ثابت = ٠ cy ay + by + و معادله درجه دوم = ٠ c + br + ar را معادلهی مشخصه(کمکی) آن است. در اینجا سه وضعیت متفاوت برای ریشههای معادله مشخصه رخ میدهد: c ١ e r١x

Διαβάστε περισσότερα

تعیین محل قرار گیری رله ها در شبکه های سلولی چندگانه تقسیم کد

تعیین محل قرار گیری رله ها در شبکه های سلولی چندگانه تقسیم کد تعیین محل قرار گیری رله ها در شبکه های سلولی چندگانه تقسیم کد مبتنی بر روش دسترسی زلیخا سپهوند دانشکده مهندسى برق واحد نجف آباد دانشگاه آزاد اسلامى نجف آباد ایر ان zolekhasepahvand@yahoo.com روح االله

Διαβάστε περισσότερα

تمرینات درس ریاض عموم ٢. r(t) = (a cos t, b sin t), ٠ t ٢π. cos ٢ t sin tdt = ka۴. x = ١ ka ۴. m ٣ = ٢a. κds باشد. حاصل x٢

تمرینات درس ریاض عموم ٢. r(t) = (a cos t, b sin t), ٠ t ٢π. cos ٢ t sin tdt = ka۴. x = ١ ka ۴. m ٣ = ٢a. κds باشد. حاصل x٢ دانش اه صنعت شریف دانش ده ی علوم ریاض تمرینات درس ریاض عموم سری دهم. ١ سیم نازک داریم که روی دایره ی a + y x و در ربع اول نقطه ی,a را به نقطه ی a, وصل م کند. اگر چ ال سیم در نقطه ی y,x برابر kxy باشد جرم

Διαβάστε περισσότερα

Spacecraft thermal control handbook. Space mission analysis and design. Cubesat, Thermal control system

Spacecraft thermal control handbook. Space mission analysis and design. Cubesat, Thermal control system سیستم زیر حرارتی ماهواره سرفصل های مهم 1- منابع مطالعاتی 2- مقدمه ای بر انتقال حرارت و مکانیزم های آن 3- موازنه انرژی 4 -سیستم های کنترل دما در فضا 5- مدل سازی عددی حرارتی ماهواره 6- تست های مورد نیاز

Διαβάστε περισσότερα

2-Sink 3-Single-hop 4-Multi-hop

2-Sink 3-Single-hop 4-Multi-hop 96/01/10 مقاله: دریافت تاریخ 96/05/07 مقاله: پذیرش تاریخ حسگر شبکههای در سرخوشهها انتخاب برای ژنتیک الگوریتم از استفاده بیسیم * بهلولی علی ايران - اصفهان اصفهان دانشگاه کامپیوتر مهندسی دانشکده bohlooli@eng.ui.ac.ir

Διαβάστε περισσότερα

جلسه 9 1 مدل جعبه-سیاه یا جستاري. 2 الگوریتم جستجوي Grover 1.2 مسا له 2.2 مقدمات محاسبات کوانتمی (22671) ترم بهار

جلسه 9 1 مدل جعبه-سیاه یا جستاري. 2 الگوریتم جستجوي Grover 1.2 مسا له 2.2 مقدمات محاسبات کوانتمی (22671) ترم بهار محاسبات کوانتمی (22671) ترم بهار 1390-1391 مدرس: سلمان ابوالفتح بیگی نویسنده: هیربد کمالی نیا جلسه 9 1 مدل جعبه-سیاه یا جستاري مدل هایی که در جلسه ي پیش براي استفاده از توابع در الگوریتم هاي کوانتمی بیان

Διαβάστε περισσότερα

تمرین اول درس کامپایلر

تمرین اول درس کامپایلر 1 تمرین اول درس 1. در زبان مربوط به عبارت منظم زیر چند رشته یکتا وجود دارد (0+1+ϵ)(0+1+ϵ)(0+1+ϵ)(0+1+ϵ) جواب 11 رشته کنند abbbaacc را در نظر بگیرید. کدامیک از عبارتهای منظم زیر توکنهای ab bb a acc را ایجاد

Διαβάστε περισσότερα

اکتساب مهارت در یادگیری تقویتی و الگوریتمهای آن

اکتساب مهارت در یادگیری تقویتی و الگوریتمهای آن کنفرانس ملی فناوری انرژی و داده با رویكرد مهندسی برق و کامپیوتر Natinal Cnference f Technlgy, Energy and Data n Electrical & Cmputer Engineering کونفرانسی نهتهوهیی فهناوهری هێز و دهیتا به روانگه ئهندازیاری

Διαβάστε περισσότερα

ویرایشسال 95 شیمیمعدنی تقارن رضافالحتی

ویرایشسال 95 شیمیمعدنی تقارن رضافالحتی ویرایشسال 95 شیمیمعدنی تقارن رضافالحتی از ابتدای مبحث تقارن تا ابتدای مبحث جداول کاراکتر مربوط به کنکور ارشد می باشد افرادی که این قسمت ها را تسلط دارند می توانند از ابتدای مبحث جداول کاراکتر به مطالعه

Διαβάστε περισσότερα

تجزیهی بندرز مقدمه کشور هستند. بدین سبب این محدودیتهای مشترک را محدودیتهای پیچیده

تجزیهی بندرز مقدمه کشور هستند. بدین سبب این محدودیتهای مشترک را محدودیتهای پیچیده تجزیهی بندرز مقدمه بسیاری از مسایلی که از نطر عملی از اهمیت برخوردارند را میتوان بهصورت ترکیبی از چند مساله کوچک در نظر گرفت. در واقع بسیاری از سیستمهای دنیای واقعی دارای ساختارهایی غیر متمرکز هستند. به

Διαβάστε περισσότερα

بهبود کارایی الگوریتم بهینه سازي دسته جمعی ذرات براي بهینه سازي در محیط پویا با بهره گیري از الگوریتم بهینه سازي حدي

بهبود کارایی الگوریتم بهینه سازي دسته جمعی ذرات براي بهینه سازي در محیط پویا با بهره گیري از الگوریتم بهینه سازي حدي بهبود کارایی الگوریتم بهینه سازي دسته جمعی ذرات براي بهینه سازي در محیط پویا با بهره گیري از الگوریتم بهینه سازي حدي 1 3 2 1 مرضیه نخبه الفقهایی بابک نصیري و محمد رضا میبدي دانشکده مهندسی برق رایانه و

Διαβάστε περισσότερα

کنترل سوییچینگ بر مبنای دستیابی به نمودار حداکثر توان در سلول خورشیدی با روش هوشمند تطبیقی

کنترل سوییچینگ بر مبنای دستیابی به نمودار حداکثر توان در سلول خورشیدی با روش هوشمند تطبیقی کنترل سوییچینگ بر مبنای دستیابی به نمودار حداکثر توان در سلول خورشیدی با روش هوشمند تطبیقی مهندس سید عبدالحسین عمادی * دکتر احسان اسفندیاری چکیده: در این مقاله با استفاده از ساختار غیرخطی برای سلول خورشیدی

Διαβάστε περισσότερα

تخمین نقطه تغییر در ماتریس کواریانس فرآیند نرمال چند متغیره با استفاده از شبکه عصبی

تخمین نقطه تغییر در ماتریس کواریانس فرآیند نرمال چند متغیره با استفاده از شبکه عصبی تخمین نقطه تغییر در ماتریس کواریانس فرآیند نرمال چند متغیره با استفاده از شبکه عصبی امیرحسین امیری نویسنده مسئول( دانشیار گروه مهندسی صنایع دانشکده فنی و مهندسی دانشگاه شاهد تهران محمدرضا ملکی دانشجوی

Διαβάστε περισσότερα

روش ابداعی کنترل بهینه غیرخطی در توربین بادی با حداقل سازی نوسانات توان و گشتاور

روش ابداعی کنترل بهینه غیرخطی در توربین بادی با حداقل سازی نوسانات توان و گشتاور روش ابداعی کنترل بهینه غیرخطی در توربین بادی با حداقل سازی نوسانات توان و گشتاور فرانک معتمدی * دکترفرید شیخ االسالم 2 -دانشجوی رشته برق دانشگاه آزاد واحد نجفآباد Fa_motamedi@yahoo.com 2 -استاد گروه برق

Διαβάστε περισσότερα

عاطفه بابائی دانشآموخته کارشناسی ارشد دانشگاه علوم اقتصادی تهران. چکیده

عاطفه بابائی دانشآموخته کارشناسی ارشد دانشگاه علوم اقتصادی تهران. چکیده یادگیری تقویتی در سیستمهای چندعامله عاطفه بابائی غیرهمکار دانشآموخته کارشناسی ارشد دانشگاه علوم اقتصادی تهران a.babaee44@gmail.com چکیده یکی از مسائلی که در زمینه تحقیقات سیستمهای چندعامله مورد توجه قرار

Διαβάστε περισσότερα

سايت ويژه رياضيات درسنامه ها و جزوه هاي دروس رياضيات

سايت ويژه رياضيات   درسنامه ها و جزوه هاي دروس رياضيات سايت ويژه رياضيات درسنامه ها و جزوه هاي دروس رياضيات دانلود نمونه سوالات امتحانات رياضي نمونه سوالات و پاسخنامه كنكور دانلود نرم افزارهاي رياضيات و... کانال سایت ریاضی سرا در تلگرام: https://telegram.me/riazisara

Διαβάστε περισσότερα

مدل های GARCH بوتبوتاسترپ چکیده نصراله ایرانایرانپناه دانشگاه اصفهان طاهره اصالنی گروه آمار- دانشگاه اصفهان

مدل های GARCH بوتبوتاسترپ چکیده نصراله ایرانایرانپناه دانشگاه اصفهان طاهره اصالنی گروه آمار- دانشگاه اصفهان مالی و کاربردها و بهمن ماه 93 دانشگاه سمنان سمنان ررو شوش مدل های GARCH در بوتبوتاسترپ )iranpanah@sci.ui.ac.ir( * نصراله ایرانایرانپناه دانشگاه اصفهان گروه آمار- * دانشگاه اصفهان گروه آمار- )t.aslani@sci.ui.ac.ir

Διαβάστε περισσότερα

OFDM ﻢﺘﺴﯿﺳ ﯽﻫدزﺎﺑ ﺮﺑ لﺎﻧﺎﮐﺮﯿﺧﺎﺗ هﺮﺘﺴﮔ ﺮﯿﺛﺎﺗ

OFDM ﻢﺘﺴﯿﺳ ﯽﻫدزﺎﺑ ﺮﺑ لﺎﻧﺎﮐﺮﯿﺧﺎﺗ هﺮﺘﺴﮔ ﺮﯿﺛﺎﺗ و 2 چکیده تاثیر گستره تاخیرکانال بر بازدهی سیستم OFDM علیرضا محمودی دکتر سید محمود مدرس هاشمی modarres@cc.iut.ac.ir Alireza@mahmoodi.ir دانشکده برق وکامپیوتر دانشگاه صنعتی اصفهان انتشار چند مسیره از مهمترین

Διαβάστε περισσότερα

الگوریتم هوشمند تخصیص منابع برای برون سپاری وظایف در محیط رایانش ابری سیار

الگوریتم هوشمند تخصیص منابع برای برون سپاری وظایف در محیط رایانش ابری سیار الگوریتم هوشمند تخصیص منابع برای برون سپاری وظایف در محیط رایانش ابری سیار شیما رشیدی 1 و سعید شریفیان 2 1 دانشکده مهندسی برق دانشگاه امیرکبیر )پلی تکنیک تهران( Shima.Rashidi@aut.ac.ir دانشکده مهندسی برق

Διαβάστε περισσότερα

هدف از این آزمایش آشنایی با رفتار فرکانسی مدارهاي مرتبه اول نحوه تأثیر مقادیر عناصر در این رفتار مشاهده پاسخ دامنه

هدف از این آزمایش آشنایی با رفتار فرکانسی مدارهاي مرتبه اول نحوه تأثیر مقادیر عناصر در این رفتار مشاهده پاسخ دامنه آزما ی ش شش م: پا س خ فرکا نس ی مدا رات مرتبه اول هدف از این آزمایش آشنایی با رفتار فرکانسی مدارهاي مرتبه اول نحوه تأثیر مقادیر عناصر در این رفتار مشاهده پاسخ دامنه و پاسخ فاز بررسی رفتار فیلتري آنها بدست

Διαβάστε περισσότερα

تئوری جامع ماشین بخش سوم جهت سادگی بحث یک ماشین سنکرون دو قطبی از نوع قطب برجسته مطالعه میشود.

تئوری جامع ماشین بخش سوم جهت سادگی بحث یک ماشین سنکرون دو قطبی از نوع قطب برجسته مطالعه میشود. مفاهیم اصلی جهت آنالیز ماشین های الکتریکی سه فاز محاسبه اندوکتانس سیمپیچیها و معادالت ولتاژ ماشین الف ) ماشین سنکرون جهت سادگی بحث یک ماشین سنکرون دو قطبی از نوع قطب برجسته مطالعه میشود. در حال حاضر از

Διαβάστε περισσότερα

ارزیابی بهره وری متقاطع DEA بر پایه بهبود پارتو

ارزیابی بهره وری متقاطع DEA بر پایه بهبود پارتو چکیده ارزیابی بهره وری متقاطع DEA بر پایه بهبود پارتو جی.وو جونفی.چو جیاس ن سان کینگ یوآن ژو ارزیابی بهره وری متقاطع به عنوان یک ابزار گسترده برای تحلیل پوششی داده ها (DEA) دارای کاربرد گسترده ای در ارزیابی

Διαβάστε περισσότερα

عنوان: رمزگذاري جستجوپذیر متقارن پویا

عنوان: رمزگذاري جستجوپذیر متقارن پویا دانشگاه صنعتی شریف دانشکده مهندسی برق گزارش درس ریاضیات رمزنگاري عنوان: رمزگذاري جستجوپذیر متقارن پویا استاد درس: مهندس نگارنده: ز 94 دي ماه 1394 1 5 نماد گذاري و تعریف مسي له 1 6 رمزگذاري جستجوپذیر متقارن

Διαβάστε περισσότερα

مدیریت توان راکتیو در سیستمهای قدرت تجدید ساختار یافته

مدیریت توان راکتیو در سیستمهای قدرت تجدید ساختار یافته مدیریت توان راکتیو در سیستمهای قدرت تجدید ساختار یافته احمد یارمحمودی دانشجوی کارشناسی ارشد ahmadyarmahmoodi@yahoo.com نام ارائه دهنده: احمد یارمحمودی استاد راهنما: دکتر سعید لسان خالصه یکی از نگرانیها

Διαβάστε περισσότερα

دبیرستان غیر دولتی موحد

دبیرستان غیر دولتی موحد دبیرستان غیر دلتی محد هندسه تحلیلی فصل دم معادله های خط صفحه ابتدا باید بدانیم که از یک نقطه به مازات یک بردار تنها یک خط می گذرد. با تجه به این مطلب برای نشتن معادله یک خط احتیاج به داشتن یک نقطه از خط

Διαβάστε περισσότερα

طرح یافتن مکان خطا در خطوط انتقال چندترمینالی با استفاده از اندازه گیریهای ناهمگام )آسنکرون(

طرح یافتن مکان خطا در خطوط انتقال چندترمینالی با استفاده از اندازه گیریهای ناهمگام )آسنکرون( طرح یافتن مکان خطا در خطوط انتقال چندترمینالی با استفاده از اندازه گیریهای ناهمگام )آسنکرون( چکیده در این مقاله یک روش ساده با استفاده از اندازه گیری ناهمگام برای تعیین مکان خطا در خطوط انتقال چند-ترمینالی

Διαβάστε περισσότερα

آموزش شناسایی خودهمبستگی در دادههای سری زمانی و نحوه رفع آن در نرم افزار EViews

آموزش شناسایی خودهمبستگی در دادههای سری زمانی و نحوه رفع آن در نرم افزار EViews بس م الله الر حم ن الر حی م آموزش شناسایی خودهمبستگی در دادههای سری زمانی و نحوه رفع آن در نرم افزار EViews Econometrics.blog.ir حسین خاندانی مدرس داده کاوی و اقتصادسنجی بس م الله الر حم ن الر حی م سخن

Διαβάστε περισσότερα

تابع هزینه حداقل میانگین مربعات توأم با حداقل واریانس خطا

تابع هزینه حداقل میانگین مربعات توأم با حداقل واریانس خطا تابع هزینه حداقل میانگین مربعات توأم با حداقل واریانس خطا فریبا پاکیزه حاجی یار هادی صدوقی یزدی دانشجوی کارشناسی ارشدگروه کامپیوتر دانشکده مهندسی دانشگاه فردوسی مشهد ایران f.pazehhajyar@stu.um.ac.r دانشیار

Διαβάστε περισσότερα

رسوب سختی آلیاژهای آلومینیوم: تاريخچه : فرآیند رسوب سختی )پیرسختی( در سال 6091 بوسیله آلمانی کشف گردید.

رسوب سختی آلیاژهای آلومینیوم: تاريخچه : فرآیند رسوب سختی )پیرسختی( در سال 6091 بوسیله آلمانی کشف گردید. رسوب سختی آلیاژهای آلومینیوم تاريخچه فرآیند رسوب سختی )پیرسختی( در سال 6091 بوسیله Dr.A.Wilm آلمانی کشف گردید. دکتر Wilm یک آلیاژ 4 درصد مس و 9/5 درصد منیزیم را حرارت داده و پس از آن به سرعت سرد نمود و

Διαβάστε περισσότερα

مسئله مکانیابی رقابتی تسهیالت در بازار با استفاده از خوشهبندی مشتریان

مسئله مکانیابی رقابتی تسهیالت در بازار با استفاده از خوشهبندی مشتریان مسئله مکانیابی رقابتی تسهیالت در بازار با استفاده از خوشهبندی مشتریان شهابالدین یزدانی * محمدعلی فرقانی 2 مسعود رشیدینژاد 3 دانشگاه شهید باهنر کرمان تاریخ دریافت مقاله: 303/90/ تاریخ پذیرش مقاله: 303//22

Διαβάστε περισσότερα

ارزیابی پاسخ لرزهای درههای آبرفتی نیمسینوسی با توجه به خصوصیات مصالح آبرفتی

ارزیابی پاسخ لرزهای درههای آبرفتی نیمسینوسی با توجه به خصوصیات مصالح آبرفتی ارزیابی پاسخ لرزهای درههای آبرفتی نیمسینوسی با توجه به خصوصیات مصالح آبرفتی دانا امینی بانه 1 * بهروز گتمیری 2 دانشجوی کارشناسی ارشد مهندسی عمران ژئوتکنیک - دانشگاه تهران 2- استاد دانشکده مهندسی عمران

Διαβάστε περισσότερα

کنترل تطبیقی غیر مستقیم مبتنی بر تخصیص قطب با مرتبه کسری

کنترل تطبیقی غیر مستقیم مبتنی بر تخصیص قطب با مرتبه کسری چکیده : کنترل تطبیقی غیر مستقیم مبتنی بر تخصیص قطب با مرتبه کسری روش طراحی قوانین کنترل چندجمله ای با استفاده از جایابی قطب راه کار مناسبی برای بسیاری از کاربردهای صنعتی می باشد. این دسته از کنترل کننده

Διαβάστε περισσότερα

یک سیستم تخصیص منابع هوشمند بر مبنای OFDMA در یک سیستم بیسیم توزیع شده با استفاده از تئوری بازیها

یک سیستم تخصیص منابع هوشمند بر مبنای OFDMA در یک سیستم بیسیم توزیع شده با استفاده از تئوری بازیها یک سیستم تخصیص منابع هوشمند بر مبنای OFDMA در یک سیستم بیسیم توزیع شده با استفاده از تئوری بازیها حامد رشیدی 1 و سیامک طالبی 2 1 -دانشگاه شهید باهنر كرمان 2 -دانشگاه شهید باهنر كرمان Hamed.hrt@gmail.com

Διαβάστε περισσότερα

یدنب هشوخ یاه متیروگلا

یدنب هشوخ یاه متیروگلا تحلیل خوشه ای مقدمه در این قسمت ابتدا چند تعریف بیان می کنیم و در ادامه به جزئیات این تعاریف و کاربردهای تحلیل خوشه ای در علوم مختلف می پردازیم و نیز با مشکالتی که در تحلیل خوشه ای مواجه هستیم اشاره ای

Διαβάστε περισσότερα

اصول انتخاب موتور با مفاهیم بسیار ساده شروع و با نکات کاربردی به پایان می رسد که این خود به درک و همراهی خواننده کمک بسیاری می کند.

اصول انتخاب موتور با مفاهیم بسیار ساده شروع و با نکات کاربردی به پایان می رسد که این خود به درک و همراهی خواننده کمک بسیاری می کند. اصول انتخاب موتور اصول انتخاب موتور انتخاب یک موتور به در نظر گرفتن موارد بسیار زیادی از استانداردها عوامل محیطی و مشخصه های بار راندمان موتور و... وابسته است در این مقاله کوتاه به تاثیر و چرایی توان و

Διαβάστε περισσότερα

جلسه 15 1 اثر و اثر جزي ی نظریه ي اطلاعات کوانتومی 1 ترم پاي یز جدایی پذیر باشد یعنی:

جلسه 15 1 اثر و اثر جزي ی نظریه ي اطلاعات کوانتومی 1 ترم پاي یز جدایی پذیر باشد یعنی: نظریه ي اطلاعات کوانتومی 1 ترم پاي یز 1391-1391 مدرس: دکتر ابوالفتح بیگی ودکتر امین زاده گوهري نویسنده: محمدرضا صنم زاده جلسه 15 فرض کنیم ماتریس چگالی سیستم ترکیبی شامل زیر سیستم هايB و A را داشته باشیم.

Διαβάστε περισσότερα

قیمت گذاری محصول در یک زنجیره تامین دوسطحی با استفاده از

قیمت گذاری محصول در یک زنجیره تامین دوسطحی با استفاده از فصلنامه علمی پژوهشی مطالعات مدیریت صنعتی سال چهاردهم شماره 34 زمستان 59 صفحات 59-1 قیمت گذاری محصول در یک زنجیره تامین دوسطحی با استفاده از مفهوم تئوری بازیها در محیط فازی شهودی آمنه خدیور عادل آذر فاطمه

Διαβάστε περισσότερα

2/13/2015 حمیدرضا پوررضا H.R. POURREZA 2 آخرین گام در ساخت یک سیستم ارزیابی آن است

2/13/2015 حمیدرضا پوررضا H.R. POURREZA 2 آخرین گام در ساخت یک سیستم ارزیابی آن است 1 ارزیا ی م حمیدرضا پوررضا قد 2 آخرین گام در ساخت یک سیستم ارزیابی آن است 1 ف ی ا ط لاحات 3 :Degrees of Freedom (DOF) این اصطلاح در سیستمهاي ردیاب استفاده میشود و بنابه تعریف عبارتست از آزادي حرکت انتقالی

Διαβάστε περισσότερα

بسمه تعالی «تمرین شماره یک»

بسمه تعالی «تمرین شماره یک» بسمه تعالی «تمرین شماره یک» شماره دانشجویی : نام و نام خانوادگی : نام استاد: دکتر آزاده شهیدیان ترمودینامیک 1 نام درس : ردیف 0.15 m 3 میباشد. در این حالت یک فنر یک دستگاه سیلندر-پیستون در ابتدا حاوي 0.17kg

Διαβάστε περισσότερα

جلسه 22 1 نامساویهایی در مورد اثر ماتریس ها تي وري اطلاعات کوانتومی ترم پاییز

جلسه 22 1 نامساویهایی در مورد اثر ماتریس ها تي وري اطلاعات کوانتومی ترم پاییز تي وري اطلاعات کوانتومی ترم پاییز 1391-1392 مدرس: ابوالفتح بیگی و امین زاده گوهري نویسنده: محمد مهدي مجاهدیان جلسه 22 تا اینجا خواص مربوط به آنتروپی را بیان کردیم. جهت اثبات این خواص نیاز به ابزارهایی

Διαβάστε περισσότερα

1- مقدمه ای بر شبیه سازی< سر فصل مطالب

1- مقدمه ای بر شبیه سازی< سر فصل مطالب 1 بنام خدا بهینه سازی شبیه سازی Simulation Optimization Lecture 1 مروری بر شبیه سازی A review on Simulation 1- مقدمه ای بر شبیه سازی< سر فصل مطالب 2 شماره عنوان فصل 1-1 تعاریف 2-1 مثال هایی از شبیه سازی

Διαβάστε περισσότερα

سپیده محمدی مهدی دولتشاهی گروه الکترونیک موسسه آموزش عالی جهاد دانشگاهی استان اصفهان استاد یار دانشکده مهندسی برق دانشگاه آزاد اسالمی واحد نجف آباد

سپیده محمدی مهدی دولتشاهی گروه الکترونیک موسسه آموزش عالی جهاد دانشگاهی استان اصفهان استاد یار دانشکده مهندسی برق دانشگاه آزاد اسالمی واحد نجف آباد طراحی یک گیرنده مخابرات نوری CMOS داده 2.5Gb/s برای نرخ سپیده محمدی مهدی دولتشاهی گروه الکترونیک موسسه آموزش عالی جهاد دانشگاهی استان اصفهان استاد یار دانشکده مهندسی برق دانشگاه آزاد اسالمی واحد نجف آباد

Διαβάστε περισσότερα

Beta Coefficient نویسنده : محمد حق وردی

Beta Coefficient نویسنده : محمد حق وردی مفهوم ضریب سهام بتای Beta Coefficient نویسنده : محمد حق وردی مقدمه : شاید بارها در مقاالت یا گروهای های اجتماعی مربوط به بازار سرمایه نام ضریب بتا رو دیده باشیم یا جایی شنیده باشیم اما برایمان مبهم باشد

Διαβάστε περισσότερα

کنترل فرکانس- بار سیستم قدرت چند ناحیه شامل نیروگاههای حرارتی بادی و آبی

کنترل فرکانس- بار سیستم قدرت چند ناحیه شامل نیروگاههای حرارتی بادی و آبی راهنماي تدوين مقاله کامل همايش م ی "ل برق مخابرات و توسعه پايدار " کنترل فرکانس- بار سیستم قدرت چند ناحیه شامل نیروگاههای حرارتی بادی و آبی سیاوش محمدپور محمدرضا علیزاده پهلوانی 1- کارشناس ارشد دانشگاه

Διαβάστε περισσότερα

1) { } 6) {, } {{, }} 2) {{ }} 7 ) { } 3) { } { } 8) { } 4) {{, }} 9) { } { }

1) { } 6) {, } {{, }} 2) {{ }} 7 ) { } 3) { } { } 8) { } 4) {{, }} 9) { } { } هرگاه دسته اي از اشیاء حروف و اعداد و... که کاملا"مشخص هستند با هم در نظر گرفته شوند یک مجموعه را به وجود می آورند. عناصر تشکیل دهنده ي یک مجموعه باید دو شرط اساسی را داشته باشند. نام گذاري مجموعه : الف

Διαβάστε περισσότερα

پخش بار اقتصادی با در نظر گرفتن محدودیت برخطی و ترکیبی

پخش بار اقتصادی با در نظر گرفتن محدودیت برخطی و ترکیبی پخش بار اقتصادی با در نظر گرفتن محدودیت برخطی و ترکیبی نورالدین 3 2 و محسن محمدی قدیمی 1 حسن حسین زاده 1 دانشگاه آزاد اسالمی واحد اردبیل باشگاه پژوهشگران جوان ونخبگان اردبیل ایران 2 گروه ریاضی واحد اردبیل

Διαβάστε περισσότερα

آزمایش ۱ اندازه گیری مقاومت سیم پیچ های ترانسفورماتور تک فاز

آزمایش ۱ اندازه گیری مقاومت سیم پیچ های ترانسفورماتور تک فاز گزارش آزمایشگاه ماشینهای الکتریکی ۲ آزمایش ۱ اندازه گیری مقاومت سیم پیچ های ترانسفورماتور تک فاز شرح آزمایش ماژول تغذیه را با قرار دادن Breaker Circuit بر روی on روشن کنید با تغییر دستگیره ماژول منبع تغذیه

Διαβάστε περισσότερα

فصل چهارم تعیین موقعیت و امتدادهای مبنا

فصل چهارم تعیین موقعیت و امتدادهای مبنا فصل چهارم تعیین موقعیت و امتدادهای مبنا هدف های رفتاری پس از آموزش و مطالعه این فصل از فراگیرنده انتظار می رود بتواند: 1 راهکار کلی مربوط به ترسیم یک امتداد در یک سیستم مختصات دو بعدی و اندازه گیری ژیزمان

Διαβάστε περισσότερα

ارائه یک مدل ریاضی جهت بهینه سازی فرایند توسعه محصول

ارائه یک مدل ریاضی جهت بهینه سازی فرایند توسعه محصول ارائه یک مدل ریاضی جهت بهینه سازی فرایند توسعه محصول محسن شفیعی نیک آبادی محمدعلی بهشتی نیا و رضا رفیعی پور اطالعات مقاله چکیده واژگان كلیدی: فرایند توسعه محصول مدل ریاضی مزدوج همپوشانی ها وابستگی متقابل.

Διαβάστε περισσότερα

تحلیل میدانی سیستمهای الکترومغناطیسی با در نظر گرفتن پدیدۀ هیسترزیس به

تحلیل میدانی سیستمهای الکترومغناطیسی با در نظر گرفتن پدیدۀ هیسترزیس به تحلیل میدانی سیستمهای الکترومغناطیسی با در نظر گرفتن پدیدۀ هیسترزیس به روش اجزاء محدود اسماعیل فلاح جواد شکرالهی مغانی قطب علمی قدرت دانشکده برق دانشگاه صنعتی امیرکبیر Email: moghani@aut.ac.ir, esmael_fallah@aut.ac.ir

Διαβάστε περισσότερα

7- روش تقریب میانگین نمونه< سر فصل مطالب

7- روش تقریب میانگین نمونه< سر فصل مطالب 1 بنام خدا بهینه سازی شبیه سازی Simulation Optimization Lecture 7 روش تقریب میانگین نمونه Sample Average Approximation 7- روش تقریب میانگین نمونه< سر فصل مطالب 2 شماره عنوان فصل 1-7 معرفی 2-7 تقریب 3-7

Διαβάστε περισσότερα

الگوریتم مسيریابی جدید مبتنی بر فاصله برای کاهش مصرف انرژی در شبکه های حسگر بی سيم

الگوریتم مسيریابی جدید مبتنی بر فاصله برای کاهش مصرف انرژی در شبکه های حسگر بی سيم الگوریتم مسيریابی جدید مبتنی بر فاصله برای کاهش مصرف انرژی در شبکه های حسگر بی سيم 2 1 فرهاد مصری نژاد ناصر محمد رحیم پناه 1 دانشگاه آزاد اسالمی واحد شهر مجلسی دانشکده مهندسی برق و کامپیوتر اصفهان ایرانnaserrahimpanah@gmail.com

Διαβάστε περισσότερα

زمین شناسی ساختاری.فصل پنجم.محاسبه ضخامت و عمق الیه

زمین شناسی ساختاری.فصل پنجم.محاسبه ضخامت و عمق الیه پن ج م فص ل محاسبه ضخامت و عم ق الهی زمین شناسی ساختاری.کارشناسی زمین شناسی.بخش زمین شناسی دانشکده علوم.دانشگاه شهید باهنر کرمان.استاد درس:دکتر شهرام شفیعی بافتی 1 تعاریف ضخامت - فاصله عمودی بین دو صفحه

Διαβάστε περισσότερα

آموزش SPSS مقدماتی و پیشرفته مدیریت آمار و فناوری اطالعات -

آموزش SPSS مقدماتی و پیشرفته مدیریت آمار و فناوری اطالعات - آموزش SPSS مقدماتی و پیشرفته تهیه و تنظیم: فرزانه صانعی مدیریت آمار و فناوری اطالعات - مهرماه 96 بخش سوم: مراحل تحلیل آماری تحلیل داده ها به روش پارامتری بررسی نرمال بودن توزیع داده ها قضیه حد مرکزی جدول

Διαβάστε περισσότερα

تحليل امواج خطی در محيط دریایی با استفاده از روش بدون شبكه حداقل مربعات گسسته مختلط

تحليل امواج خطی در محيط دریایی با استفاده از روش بدون شبكه حداقل مربعات گسسته مختلط فصلنامه علمی - سال چهارم زمستان 69 تحليل امواج خطی در محيط دریایی با استفاده از روش بدون شبكه حداقل مربعات گسسته مختلط پرویز قدیمی 1 مرتضی کالهدوزان 2 صائب فرجی 3 pghadimi@aut.ac.ir 1- استاد دانشکده مهندسی

Διαβάστε περισσότερα

سلسله مزاتب سبان مقدمه فصل : زبان های فارغ از متن زبان های منظم

سلسله مزاتب سبان مقدمه فصل : زبان های فارغ از متن زبان های منظم 1 ماشیه ای توریىگ مقدمه فصل : سلسله مزاتب سبان a n b n c n? ww? زبان های فارغ از متن n b n a ww زبان های منظم a * a*b* 2 زبان ها پذیرفته می شوند بوسیله ی : ماشین های تورینگ a n b n c n ww زبان های فارغ

Διαβάστε περισσότερα